تشخیص دستنوشته برخط فارسی به کمک ویژگی های مبتنی بر شکل

پایان نامه
چکیده

در این تحقیق روشی برای تشخیص دستنوشته برخط فارسی مبتنی بر قطعه بندی زیر-کلمه به حروف و شناسایی حروف قطعه بندی شده با استفاده از مدل مخفی مارکوف گسسته ارائه شده است. تصویر متن تایپی یا دستنوشته به دلیل این که به صورت یکجا و بعد از نوشتن کامل آن در دسترس است برون خط نامیده می شود در حالی که دستنوشته دریافت شده توسط وسایل دیجیتال نظیر تبلت و تلفن همراه با صفحه لمسی به دلیل در دسترس بودن اطلاعات نوشته همزمان با عمل نوشتن، برخط نامیده می شود. برای تشخیص دستنوشته برون خط لازم است برای استخراج ویژگی از روش های پردازش تصویر استفاده شود ولی ویژگی های دستنوشته برخط مستقیماً از اطلاعات آن که شامل مختصات افقی و عمودی نقاط نوشته است استخراج می شود. استخراج حروف در زیر-کلمه با قطعه بندی اضافی بر اساس زاویه نوشته با محور افقی انجام شده است و سپس با حذف موارد اشتباه طی چند مرحله، نقاط قطعه بندی نهایی مشخص می شوند. به دلیل وجود نقاط قطعه بندی اضافی، ترکیب های مختلف قطعات امتیازبندی می شوند که این امتیازبندی بر حسب میانگین احتمال نرمالیزه شده رخداد توالی مشاهده قطعات آن ها در مدل مخفی مارکوف است. سپس ترکیب های دارای بالاترین امتیاز به عنوان کاندیدهای نهایی تشخیص گروه حروف معرفی می شوند، با استفاده از فرهنگ لغت متنی، گزینه های با گروه حروف مشابه پیدا می شود و گزینه هایی که در فرهنگ لغت موجود نیستند حذف می شوند. در مرحله بعد گزینه هایی که از نظر وجود علامت در بالا و پایین زیر-کلمه با زیر-کلمه ورودی منطبق نیستند حذف می شوند و در مرحله نهایی گزینه هایی که تعداد حرکت های زیر-کلمه در بالا و پایین آن ها با زیر-کلمه ورودی مساوی نیست حذف می شوند. صحت قطعه بندی با روش این تحقیق با استفاده از ground truth ساخته شده آزمایش شده است که 85/47 درصد نقاط قطعه بندی به درستی شناسایی شده اند و 60/1 درصد نقاط اشتباه پیدا شده است. تشخیص زیر-کلمه با دقت 37/85 درصد انجام شده است که برای 10 گزینه اول بازشناسی به 73/34 درصد می رسد. این مقدار نسبت به کارهایی که با روش کلی نگر که کل زیر-کلمه را به عنوان الگوی شناسایی در نظر می گیرند و روی پایگاه داده تحقیق انجام شده اند خیلی کمتر است که به دلیل ماهیت روش مبتنی بر قطعه بندی است که نیاز به قطعه بندی دقیق دارد اما کار مشابهی با همین پایگاه داده مبتنی بر تشخیص حروف وجود ندارد تا مقایسه انجام شود. مزیت روش مبتنی بر قطعه بندی که در این تحقیق از آن استفاده شده، نسبت به روش کلی نگر در این است که برای شناختن زیر-کلمات جدید کافی است که متن آن ها به سیستم اضافه شود در حالی که روش کلی نگر نیاز به نمونه های جدید دستنوشته دارد. مهم ترین محدودیت این روش، عدم کارایی الگوریتم های قطعه بندی است که خطای آن به مرحله تشخیص منتقل می شود و منجر به کاهش چشمگیر در نرخ شناسایی می شود.

منابع مشابه

تشخیص دستنوشته برخط فارسی با رویکرد تجزیه ای

در این تحقیق روشی برای تشخیص دستنوشته برخط فارسی بر مبنای شناسایی حروف سازنده زیرکلمات ارائه شده است. ورودی سیستم های تشخیص دستنوشته برخط مجموعه ای از نقاط در صفحه مربوط به دستنوشته است که عموماً توسط وسایل دیجیتال نظیر تبلت ها و تلفن های همراه هوشمند و به طور هم زمان با عمل نوشتن جمع آوری می شوند و به همین دلیل به آن برخط گویند. در روش پیشنهادی در یک گام ساده سازی داده ورودی به صورت مجموعه ای...

15 صفحه اول

تشخیص بر خط دستنوشته فارسی مبتنی بر روش های یادگیری

در این پایان نامه، ضمن بررسی تاریخچه و تعدادی از روش های متداول تشخیص برخط حروف و کلمات، یک سیستم تشخیص برخط کلمات فارسی، طراحی و پیاده سازی شده است. ورودی این سیستم توسط قلم نوری دریافت می شود. اخیراً بعلت فراگیر شدن دستگاه های کامپیوتر جیبی و تلفن های همراه پیشرفته، اهمیت چنین سیستمی، بیش از پیش مورد توجه قرار گرفته است. در روش پیشنهادی ما، عمل شناسایی دستنوشته، از طریق جستجوی پرتو انجام می شو...

15 صفحه اول

یک روش دو مرحلهای برای بازشناسی کلمات دستنوشته فارسی به کمک بلوکبندی تطبیقی گرادیان تصویر

This paper presented a two step method for offline handwritten Farsi word recognition. In first step, in order to improve the recognition accuracy and speed, an algorithm proposed for initial eliminating lexicon entries unlikely to match the input image. For lexicon reduction, the words of lexicon are clustered using ISOCLUS and Hierarchal clustering algorithm. Clustering is based on the featur...

متن کامل

تشخیص و جداسازی گره و میانگره در ساقه‌های نیشکر به صورت برخط با کمک بینایی ماشین

امروزه مواد خام زیستی به عنوان منبع انرژی تجدید پذیر، سوخت و غیره با توجه به بومی و در دسترس بودن مورد استفاده قرار گرفتند. میانگره حاوی گلوکان است و برای تولید الکل مناسب می­باشد. حال آنکه گره با درصد لیگنین و سلولز بالا برای شرکت‌هایی که نیاز به حرارت و انرژی دارند مناسب می­­باشد. بنابراین جداسازی اجزای مواد زیستی ارزش این مواد را افزایش خواهد داد. بعلاوه یکنواختی مواد اولیه عملیات کنترل و پر...

متن کامل

ارزیابی روش تصویربرداری حرارتی در جهت تشخیص و گریدینگ واریکوسل به کمک ویژگی های تبدیل موجک

زمینه و هدف: واریکوسل اتساع و پیچ­خوردگی غیرطبیعی شبکه وریدی (سیاهرگی) بالای بیضه‌ها است. الگو توزیع حرارتی غیرطبیعی را می­توان در کیسه بیضه توسط تصویربرداری حرارتی تشخیص داد. تصویربرداری حرارتی روشی از راه دور، بدون تماس و غیرتهاجمی است. روش­ بررسی: مطالعه حاضر از نوع توصیفی تحلیلی است. با استفاده از دوربین مادون قرمز غیرتماسیSDS Hotfind L و عکسبرداری از...

متن کامل

ارائه ویژگیهای دیداری جدید در تصویر دستنوشته فارسی برای تشخیص روحیات افراد

در این مقاله، ویژگیهای دیداری جدیدی برای تشخیص روحیات افراد بر اساس دست نوشته فارسی پیشنهاد شده است. هدف این پژوهش این است که مشخصاتی که گرافولوژیستها در مورد مشخصات دست نوشته بیان می کنند را بتوان با کمک کامپیوتر براساس تصویر دست نوشته به طور خودکار استخراج کرد. بنابراین باید این مشخصات به صورت ویژگیهای دیداری قابل استخراج از تصویر بیان شوند. برای این منظور ابتدا تصاویر دست نوشته ها پیش پردازش...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023